陈钢：作为一个科学家，我为什么要死磕香菜和基因的关系？ |　造就

查看原文

其他

Original 2016-11-25 造就造就

https://v.qq.com/txp/iframe/player.html?width=500&height=375&auto=0&vid=b034856zzdj

华大基因x造就联合呈现

陈钢

WeGene联合创始人兼CTO

香港医管局大数据顾问

说基因组为什么要说吃的？

因为“吃”这种事情有时候是写在基因里的，比如说像我这样的身材就不是一天可以炼成的。

香菜是一个很常见的食物，我们经常会在自己餐桌上看到香菜，但我们身边有些人是很不喜欢吃香菜的。不管你是吃兰州拉面，还是吃麻辣烫，总会有人跟老板说：“不要香菜！”

这个事情是不是每个地方的人都是这样子呢？有人就在全球的范围内做了这样的调查，发现不同地区的人对香菜的喜好是有很大的差异的。

吃不吃香菜基因说了算？

比如说南欧有很多人觉得香菜有奇怪的味道，而到了南亚这个地方，就只有相对比较少的人觉得香菜味道奇怪了。

这样的事情不仅仅只是一个有趣的玩笑，或者一个有趣的新闻，这个事情有着大量的科学研究和记载。

中科院，我们国家最大最好最顶级的研究机构在自己的官方微博上说，人们对香菜的喜好是跟基因组有关系的，我们甚至找到了它跟基因组上什么样的地方有关系。

今天我们通过个人基因组检测，也可以知道你到底是否喜欢香菜，是否会觉得香菜有奇怪的味道。

所有的这一切到底是如何做到的呢？这个事情的过程其实很简单，曾经有一家美国公司叫23andMe（23是人的染色体的对数），他向所有用户问了这样两个问题：

你觉得香菜的味道像肥皂吗？

通常我们认为肥皂这个气味，是不太好吃的，不太好闻的。

你喜欢吃香菜吗？

当然问题的答案选项也非常简单：是、不是、不知道。

然后他们基于这样的研究，再加上人们大量的基因组数据，发表了一篇经过了专家同行评审的学术论文，最终得到了大家刚才看到的中科院微博引用的结果。

它的结论是这样子的：通过一种叫做全基因组关联分析的技术，我们知道了人的基因组上面到底什么地方会跟香菜的喜好，或者对香菜的气味有明显的统计上的相关性。

同时它发现这个突变正好位于一个人的嗅觉受体上，由此得到一个结论，这个基因上的这个位点的基因型，会影响人们对香菜这个食物的喜好。

听上去一切都非常完美？

中国吃货和美国吃货的基因差异

我们知道人群的基因组是有多样性的，跟植物一样，不同的人群之间的基因组，有非常大的差异。

我们可以看看，这家公司找到了这个跟香菜喜好有关的位点在不同人群上的分布，似乎跟刚才我们看到的那个对香菜喜好在人群中的分布有点一致性，全球人群的分布来自于“千人基因组”这样一个专门研究人群基因组多样性的研究结果。

我们可以看到，在非洲、在南亚、在欧洲乃至我们今天的北京，这个位点的突变情况有非常大的差异。

大家知道，我们的祖先或者说我们现代智人这个物种都是大概在6、7万年前开始，从非洲那块土地上迁移出来的，已经有无数的化石和分子类型的结果证明了这个事情。

如果我们把这些数据和跟香菜的喜好相关的这个位点突变情况结合在一起看，我们会发现我们的祖先真的很不喜欢吃香菜，相反，南亚人民真的很喜欢吃香菜，某种程度上我们也可以理解为什么那个地方会诞生一个叫咖喱的调料。

实际上人和人，人群之间的差异不仅仅是基因组那点差异，我们知道当我们说香菜的时候，我们最终是要把它吃进去的，而吃就有不同的吃法。

为了研究吃这个事情诞生了一个所谓的新物种叫“吃货”。

显然美国人民不在吃货范围内，你看美国人民怎么吃香菜？

跟玉米片拌在一起吃，跟番茄拌在一起吃，放在汉堡边上吃，放在意面边上吃，看上去五花八门丰富多彩，但其实归根结底它只有一种吃法，就是生吃。

中国人怎么吃香菜？

我们有香菜炒牛肉，有香菜拌牛肉，当然有时候我们也会把一盘生香菜摆在桌上，但最终还是把它丢进了火锅。

总而言之我们基本上不生着吃，我们把它加上各种调味料，有滋有味地吃。所以你说美国人吃香菜的习惯和我们吃香菜的习惯是一码事吗？

花1000万去测试为啥有人爱香菜有人恨香菜？

因此我们立刻会有一个问题，刚才那个研究结果在中国人身上，在亚洲人身上是不是真的有效？我们是不是真的可以通过在美国人身上研究找到的这个位点去判断一个中国吃货是否喜欢吃香菜？

做为一个科学家，我想在中国人身上重新做这个研究。我们想知道中国人的基因组跟香菜的关系，是不是依然跟美国人做出来的结果一致？

这个事情作为一个研究项目，我们可以向自然基金委、向科技部去申请钱说：“我要测一万个人的基因组，研究它跟这些人喜好香菜的关系。”

然后你需要多少钱呢？

按照相对廉价的基因检测技术来说，一个人的基因组测序大概只需要花1000人民币，然后我们要测一万个人。于是我们去跟科技部说我需要1000万去测一下中国人为什么有的喜欢吃香菜，有的人不喜欢。

你觉得这个基金的评审人员会对你说什么？我估计你连学校或者是本身你院所的那一关就过不去，“你居然研究吃香菜？！”

用“互联网+1毫升唾液”的方式检测基因

所以我们换个方法来做这个事情。

我们知道互联网改变了很多事情，它改变了大家今天来这里的方式，很多人坐滴滴过来，既然如此，互联网是不是也可以改变基因组学的研究？

我所在的团队和公司在做一个这样的尝试，我们试图给给每一个普通人，给每一个一般的消费者去测基因组信息。

我们以往看到的基因组检测似乎是一件困难的事情，需要采血，需要提取DNA。

但实际上这一切都在改变，今天我们只需要向这样一个小小的塑料管材里面吐上1~2毫升的唾液，这个神奇的塑料管就可以在常温下，把你唾液中间脱落的细胞里DNA保存足够长的时间，足够它在高质量的情况下通过顺丰或ems抵达一个标准的基因检测实验室。

到达实验室之后，我们可以用各种基因检测的手段，从基因芯片到测序，把这个用户的基因组信息测出来，最终我们可以去对这些基因组数据做分析，得到一些有趣或有用的事情，比如混血的成分，运动、营养的情况等等。

如果有很多人通过我们的网站、社区和微信公众号做了这样的检测，那我们接下来去研究中国人的基因组跟香菜喜好的关系就变得相对的简单了。

我们发出了一个问卷调查，问卷调查里面包含了刚才提到的两个问题：你喜欢吃香菜吗？你是否觉得香菜有奇怪的味道？然后我们很快得到这些人对这两个问题的回答以及他们的基因组数据。

所以大概在两周以前的某个晚上，我在我们的社区里发动了这个调查，用了大概一周多的时间，有300多个人参与了，我们发现一些很有趣的事情：

有40%的人不仅觉得香菜没有肥皂的味道，而且觉得香菜非常香，“否则它为什么要叫‘香菜’呢？”另外尽管有人觉得香菜有奇怪的味道，但他就是爱香菜，所以说这是个吃货的世界，“虽然它很难闻，但我还是要吃。”

我们为什么要跟香菜死磕？

有了这样的信息，我们知道了一个中国人是否喜欢吃香菜，我们也知道了他的基因组数据是什么样子，那么接下来就可以去验证那个传说中跟香菜喜好有关的位点，是不是在中国人的基因组上面跟香菜的喜好同样有关？

这个验证其实很简单，我们把人群分为两组，针对第一个问题，“你是否喜欢吃香菜”——喜欢或者不喜欢，我们去看看两组人在这个位点上的基因型是否有统计学上的差异。

然后我们得到了一个p值（p值有个神奇的数字是0.05，当P值越小的时候表示统计显著性越高，意味着两者的相关性越强；而当p值接近于1的时候，我们可以认为两者没有关系，是一种随机的事情）。

现在这个值是将近0.8，所以，第一我们否定了这个事情，这个位点至少跟一个人是否喜欢香菜是没有关系的，或者更严格点说跟一个中国人是否喜欢香菜没有统计显著的相关性。

第二个问题我们以同样的方式去做这个分析，验证这个位点的差异性，得到的这个P值更加的接近于1，说明这个相关性更加的没有，这个与美国人对香菜的喜好相关的位点的基因型在两组人中间是随机分布的。

我们否定了这个事情之后，我们紧接着马上要问下一个问题了：中国人的基因组上面哪个位点，或者哪些位点，或者哪些基因会跟香菜的喜好有关？

我们做了一些尝试，当然，这个事情还处于很早期的阶段，我们发现了一些统计性很强的位点，随着数据量的扩大，随着样本量的扩大，我们可以对这个问题得到更好的，更显着更准确的结果，甚至我们可以继续做一些，基因编辑的实验来验证这个事情。

接下来的问题是：这个世界值得研究的事情很多，为什么要去研究香菜？

是不是有更多其它的、更有价值的事情可以去做？

从香菜到乳腺癌，建立中国人基因数据库的意义

其实一个人对香菜的喜好对我们做基因组研究的人来说，就是一个“表型”。一个人对药物的反应、患乳腺癌的风险、得了一种肿瘤之后他的愈后是什么情况、他对某些食物是否过敏……这统统都是表型。

当我们有高效的方式研究清楚基因组跟香菜喜好的关系时，我们同样有希望去研究它跟其它表型的关系，而这些研究都依赖于基因组数据。

其实今天大量的研究都已经发表出来了，比如说我们为了说明基因测序技术很有用经常举的一个例子就是安吉丽娜·朱莉。她做完基因检测之后，发现她患乳腺癌的风险很高，于是通过手术降低了风险。

很多人想把这个model移到中国人身上去做，但是中国人的基因组跟美国人是不一样的。

安吉丽娜·朱莉的乳腺癌的遗传性风险之所以高，是因为它在一个叫BRCA1的基因上有突变，而BRCA1这个基因上的突变情况，中国人跟美国人是有特别大的差异的。

如果有了这样的差异，我们直接把在白人或者是在美国人身上得到的研究成果，直接应用于中国人身上的时候，会产生什么样的后果，准确性会是什么样子？

不可想象。

如果我们想要每一个中国人能早一天享受到由基因检测可以实现的精准医疗所带来的好处，我们必须要做到一件事情就是建立中国人自己的基因组数据库。

这个事情不仅仅是政府的事情，不仅仅是在座的科学家，或者说中国的科学家的事情，实际上每一个人都可以参与到这个事情来。

通过基因组数据，我们不仅可以知道关于自己的事情，同时，每一份贡献出来的数据，不管是基因组的信息，还是我刚才提到的表型信息，都会对中国人，对现在的这一代人，和将来的每一代人产生很深远的影响。

你贡献的每一份数据都会促进中国精准医学的发展，让它早一天，早一个小时，或者早一秒到来，让我们的后代可以更早地享受到这一切的成果。

我想这就是为什么今天我们在这个建筑物里面去说基因组的故事，国家基因库或许能够让这一天早一点到来，也希望在座的各位或者未来在电脑屏幕前看到这次分享的人，为此做出自己的贡献。

谢谢大家，这是我的分享。

郑频频 | 我们对雾霾谈虎色变，何以对烟霾视而不见？

周红 | 被阉割的评弹，失去了生命力

王孟秋 | 全人类进入虚拟世界是不可逆的未来

张雷 | 7年，从一把油纸伞到一个材料图书馆

沈玥 | 我们正在颠覆进化论，再造伊甸园

翁经科 | 西医很好，为什么我们还要研究中医药？

沈卫东| 我们应该如何客观看待中医

张璐 | 为什么科技创新浪潮总是发生在硅谷？

点击标题查看往期回顾

高三女生醉酒后被强奸致死？检方回应

川普的成长秘辛：家庭和大学如何塑造一位“坚刚不可夺其志”的总统

常德悲剧：让谴责无差别杀戮之声更加响亮一点

2024【公共营养师】培训报名通道已开启，不限学历，23岁及以上可报！还能领2000补贴

【惊】"以为要写遗书"! 飞温哥华航班遇炸弹气旋华人崩溃大哭连空姐都吐了; 客机颠簸盘旋3小时